Model Selection

AWQ quantization

# AWQ quantization

Deepseek R1 0528 AWQ

AWQ-quantized version of DeepSeek R1 0528, supports full-context-length operation on 8x80GB GPUs using vLLM.

Large Language Model

Transformers Supports Multiple Languages

cognitivecomputations

Llama 3.3 70B Instruct AWQ

The AWQ 4-bit quantization version of Llama-3.3-70B-Instruct, developed by Meta AI, supports multiple languages and is suitable for text generation tasks.

Large Language Model

Transformers Supports Multiple Languages

Dolphin 2.9 Llama3 70b Awq

AWQ quantized version of Dolphin 2.9 Llama3 70B, suitable for vllm and other inference engines.

Large Language Model

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase